因為最近發現入侵檢測系統 (Intrusion Detection System, IDS) 有人工智慧可以發揮的空間,所以發一篇文來研究研究。
這一篇算是絕密武學,因為內容很長很多,所以我寫得很精鍊,請各位要有心理準備。不過有武功底子的人,應該一眼就能明白箇中奧妙了。首先,我先來揭示進階機器人 (Advanced Robotics) 的三個基本定義:
- 靈巧、敏捷、熟練 (Dexterity):這是屬於機械系的進階領域。
- 智慧、智能 (Intelligence):這是屬於資工系的進階領域。
- 強感測、多感測 (Sensing):這是屬於電子系的進階領域。
審計跟蹤 (Audit Trail)
我講 審計跟蹤 大家比較容易懂,也比較容易入手。
越來越多的人類活動和隨之產生之複合結果現象,形成了數位麵包屑。這數位足跡有三個用處:
- 可以了解複合系統的本質 (Nature):
我們對於 A 了解,對於 B 了解,對於 C 了解,但對於 A+B+C 表現出的系統現象和本質卻不甚了解。這個「對於本質上的了解」,足夠安總發一生的論文了。
- 使其複雜性可管理 (Complexity)
- 可以預測其本質之演化 (Prediction)
最近正在做數據科學的讀者們,看到這裡將會很有共鳴。這種數據來源通常有三種特性,先了解您才不會意外而躊躇不前,勇敢前進吧,我的勇士們:
- 異質性 (Heterogeneous):
資料從 A 系統來,又從 B 系統來,由從 C 系統來。
- 量很大 (Large):
「再大也不會太大」,這是安總的名言。
- 極端動態 (Dynamically):
注意,這裡是副詞喔,也就是說如果您的個性是不喜歡擁抱變化、享受變化,可能您在處理大數據的工作不會快樂。「工作嘛,快樂是最重要的。」
好,以上是讓各位習慣這篇的濃度,習慣這裡的靈子濃度了嗎?(死神梗)
數據增加的機緣
因為安總是仙俠小說愛好者,所以底下用一些仙俠式的比喻來說明。所謂機緣嘛,就是可遇不可求囉。遇到的時候要好好把握,不過做生意的機會就像公車,錯過了永遠還有下一班。所以千萬不要失了各位的道心啊!「您要保守您的心勝過保守一切,因為一生的果效是由心發出」。
數據增加的機緣通常,很現實地,有兩種:
- 經濟效應 (Economy):
感測器很便宜,就在設計時順手加進去了,什麼時候有這個指令可以問都不知道,忽然就有了。
- 策略價值 (Strategy):
經營層永遠有 Guts 決定要加很多新的感測器,所以數據也是從一開始就知道有的。
越是真理越明瞭,越是大道越簡捷;真理往往平凡得像陽光、空氣和水。
有了數據之後,接下來我們來談「智慧型代理人 (Intelligent Agents)」的創造。安總的人工智慧恩師,就是國內首屈一指的「智慧型代理人」先驅,當時受到其很大的啟發與指導,吾人由衷感謝敬佩。
從數據、資訊、知識,到人工智慧
這四項其實是我們各要面對的挑戰,這四個問題,分別對應四種解決方案,以下是我個人的小小建議。順帶一提,這四個挑戰,也是我們所面臨的四個泡沫,我的總建議是:做人工智慧的科學家們,要貼近真實。所謂「修真者」,就是要修真,越來越真,越來越貼近真實。請各位注意標題的順序,數據 → 資訊 → 知識 → 人工智慧:
- 您有數據嗎 (Data):
- 電子的資料包括物理九軸資訊 (哪九軸?)、電壓電流溫度、韌體所能從電路中取得的所有量測資料;
- 機械的資訊包括作動狀態回報、機架狀態感測、溫度與環境資訊;
- 資工的資料包括影、音、數位訊號、使用者記錄、錯誤記錄等。
- 您有資訊嗎 (Information):
- 「我專攻機器學習和人工智慧,但我不會寫程式也沒生過數據。」
- 沒有數據文化和軟體文化,要怎麼做機器學習和人工智慧?
- 您有知識嗎 (Knowledge):
- Absence of Domain Knowledge 一直是軟體工程最大的弊病;軟體是一種技術,用在金融就是金融軟體,用在能源就是能源軟體,同樣的技術、用在不同領域,就成了截然不同的應用,中間過程差距十分巨大。
- 「我們做產品要有根」,沒有根的產品,風一吹、輕輕一拔就沒了。
- 您有智慧嗎 (Intelligence):
- 智慧跟智商的差別:您個人的成就,是靠高智慧不是靠高智商。我寧可您傻傻的,傻人有傻福,付出不亞於任何人的努力,勤勤懇懇做好品質,客人閉著眼睛都能買您的產品、信任您的服務,很不好意思地給出小費,聚少成多,也不願意您貪小便宜,用各種藏起來的方法賺錢。
- 企業要賺錢,八成是 Dirty Work,大概只有兩成是我們研究所裡面用到的 Fancy Technology。Dirty Work 則像是跑會計事務所、跑法律事務所、跑報關行,還有傾聽同事的心聲,栽培、影響、包容、以行動去愛各種您恨鐵不成鋼的子弟。
細談智慧 (Intelligence)
接下來,我們來討論最精華的部分囉,就是「方法論 (Methodologies)」。當異質系統合成後,我們就需要系統工程的方法論,包含系統管理 (Management)、系統處理 (Processing)、系統傳輸 (Transmission)、系統抽象化與資料分析 (Visualization and Analysis)。了解這些關鍵後,您的修仙之路就能準備飛升上界啦。
所謂上界,就是原本在中域的稀世之寶,到了上界不過是雜草;上界隨處可見的草衣,到了下界可能都是聖器、仙器。
- 讓它可能可以學習 (make it possible learning)
- 讓它可能可以自動控制 (make it possible automatic control)
- 讓它可能可以模擬智慧系統的行為 (make it possible for simulation of complex intelligent systems)
入侵檢測系統 (Intrusion Detection System)
這一條修仙之路,還真是漫長啊。最後我們終於走到了應用,從心法 → 數據 → 資訊 → 知識 → 人工智慧 → 價值應用。原本不屬於長壽派的獸人族,卻跟著象族、龜族活了 500 年。對於沒有那個本命目標的王啊,又何嘗不是一種折磨?(New Gate 漫畫梗)
您生命中的命定與價值圖像清楚了嗎? (Destiny & Value) 如果還不清楚,我建議,先去做做看吧。有什麼想法就先做什麼,往前推進一碼是一碼,但務必記住,務本,打好您的基本功;務實,實實在在地活著。記住:
君子務本,本立而道生。尊師重道,就是仁義的根本吧。
- 主機型入侵偵測系統 (Host-based Intrusion Detection System, HIDS):
在第一層 (Tier-1) 可以擺一個智慧型代理人。
- 網路型入侵偵測系統 (Network-based Intrusion Detection System, NIDS):
在第二層 (Tier-2) 可以再擺一個智慧型代理人。
- 主動預防入侵偵測系統 (Intrusion Detection and Prevention Systems, IDPS):
在第三層 (Tier-3) 可以再擺一個智慧型代理人,這裡就是資料科學 (Data Science) 的最高境界了;與己和,與人和,與天地萬物和。
《Python 機器學習》是朋友推薦看的,所以根據買書不手軟的原則,買了,而且想起另一位熱愛 Python 的同事,所以買了兩本,送了他一本。
《人類簡史》赫拉利說,人類之所以與動物有別,是在於他們虛構的能力。藉由說故事,號召眾人有同一異象歸宗,組織起來成為巨大的力量進而取得壓倒性地位。
《未來簡史》這部被羅胖推薦為 2017 年必讀,它說人類從智人到神人,將藉由生物科技與人工智慧,到達神人的境界。
《Python 機器學習》